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Dwukrotnie badano testami D. Wechslera tę samą grupę osób w normie intelektualnej (N = 31) 
w odstępie 13 lat; Skalą Inteligencji dla Dzieci (WISC-R) — średnia wieku 8 lat i Skalą Inteligencji 
dla Dorosłych (WAIS-R) — 21 lat. Każde badanie przeprowadziła ta sama osoba. W 62 protokołach 
(arkuszach odpowiedzi) porównano ilorazy inteligencji, wyniki przeliczone w podtestach oraz 
wyniki czynnikowe WISC-R zarówno ze skalą WAIS-R (PL) w wersji zrenormalizowanej (2004), 
jak i z wersją WAIS-R (PL) sprzed normalizacji (1996). Znaleziono istotne statystycznie różnice 
pomiędzy wynikami testów WISC-R i WAIS-R (PL) w wersji zrenormalizowanej. Brak jest takiej 
różnicy pomiędzy WISC-R i wcześniejszą wersją WAIS-R (PL) sprzed renormalizacji. Dyskuto- 
wano konsekwencje dla praktyki psychologicznej. 


Słowa kluczowe: stabilność IQ, testy inteligencji, WISC-R, WAIS-R (PL). 


Skale Davida Wechslera są zaliczane do najbardziej znaczących testów inte- 
ligencji. W Polsce dostępne są: Skala Inteligencji D. Wechslera dla Dzieci — wer- 
sja zmodyfikowana (WISC-R — Wechsler Intelligence Scale for Children—Revi- 
sed) z 1974 roku (Matczak, Piotrowska i Ciarkowska, 1991, 1997, 2008) oraz 
Skala Inteligencji D. Wechslera dla Dorosłych Wersja Zrewidowana (WAIS-R 
— Wechsler Adult Intelligence Scale — Revised) z 1981 roku (Brzeziński, Gaul, 
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Hornowska, Machowski i Zakrzewska, 1996) i jej renormalizacja (Brzezinski 
i in., 2007), w której, m.in. zmieniono procedurę obliczania wyników przeliczo- 
nych. (Zakrzewska, 2001). Te pierwsze pełne polskie adaptacje skal Wechslera 
w większości krajów nie są już stosowane. Wśród ich zalet podkreśla się, że 
spełniają warunki rzetelności, trafności 1 normalizacji (Krasowicz-Kupis i Wie- 
jak, 2006). 

Przedmiotem zainteresowania stała się porównywalność wyników w testach 
dla dzieci oraz dorosłych. Uznanie, że poziom kompetencji intelektualnych sta- 
nowi względnie trwałą cechę człowieka, która odróżnia go od innych (Nęcka, 
2003), rodzi oczekiwanie, że wyniki testów inteligencji w różnych okresach zy- 
cia będą podobne. Inteligencja, mimo że podlega zmianom rozwojowym, dege- 
neracyjnym czy cywilizacyjnym, w kolejnych pomiarach powinna zachowywać 
stałą pozycję na tle grupy wiekowej. Iloraz inteligencji wynoszący 100 jest rów- 
ny średniej w danej populacji i w tym sensie jest wartością stałą. Badania po- 
dłużne potwierdzały stabilność wyników testowych w okresie szkoły podstawo- 
wej, średniej i wyższej (Anastasi i Urbina, 1999). Badania grup populacyjnych 
(Flynn, 2006) wykazały, że starzenie się norm powoduje wzrost wyników testo- 
wych (efekt Flynna). Dla skal wechslerowskich przyrost ten wynosi około 
0,3 punktu rocznie. Najbardziej zawyżone wartości IQ obserwowano u osób 
o niskim poziomie inteligencji. 

Amerykańscy badacze wielokrotnie wykazywali, że osiągane w WISC-R 
i WAIS-R wyniki nie są równoważne (Spitz, 1989)”, Stwierdzano wyższe wyniki 
przy pomiarze skalą dla dorosłych (WAIS-R) niż skalą dla dzieci (WISC-R), 
najczęściej w Skali Słownej i Pełnej (Grace i Sweeney, 1986; Vance, Brown, 
Hankins i Furgerson, 1987; Wilcoxon, 1982). Równoważność testów potwierdzi- 
li natomiast Sattler, Polifka, Polifka i Hilsen (1984). Wykazali brak istotnych 
różnic pomiędzy dwukrotnym badaniem adolescentów w odstępie czterech lat. 
Uzyskiwano też wyniki wyższe w WISC-R niż WAIS-R (Slate, Frost i Cross, 
1990), co uzasadniono zdecydowanie starszymi normami WISC-R w porówna- 
niu z WAIS-R. 

Najczęściej badano 16-latków ze względu na to, że obie skale zawierają 
normy dla tego wieku. Wbrew oczekiwaniom, że zadania z testu dla dzieci będą 
łatwiejsze, 16-latkowie wyższe wyniki uzyskiwali w teście dla dorosłych. Różni- 


' Tabele zamiany wyników surowych na przeliczone opracowano dla każdej grupy wiekowej, 
a nie — jak poprzednio — w relacji do wyników grupy odniesienia, którą stanowiły osoby o naj- 
wyższym poziomie intelektualnym, w wieku 20-34 lata. 

* Odwołania odnoszą się do literatury z lat osiemdziesiątych XX wieku — wtedy skale te były 
stosowane, zanim w latach dziewięćdziesiątych zastąpiły je nowsze wersje (WISC III i WAIS III). 
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ce były zależne od poziomu inteligencji, zwiększały się przy niższych warto- 
ściach IQ. Wechsler (1981) dowodził, że w szerokim zakresie wyników przecięt- 
nych WISC-R i WAIS-R dla 16-latków pozostają porównywalne. Rozbieżności 
natomiast dotyczą badanych o niskim poziomie umysłowym, u których obserwu- 
je się wyższe wyniki w WAIS-R, oraz badanych o najwyższej inteligencji, którzy 
z kolei wyższe wyniki uzyskują w WISC-R. 

Niezgodność obu skal obserwują polscy psychologowie praktycy. Zdaniem 
Aleksandry Jaworowskiej (2011) przyczyną są odrębne konwencje obliczania 
wyników. Badany w wieku 16,5 roku, który rozwiąże po jednym zadaniu z każ- 
dego testu w WISC-R, otrzyma 10 punktów przeliczonych i IQ poniżej 40, 
w WAIS-R uzyska 17 punktów i IQ = 46. Stanowi to poważny problem diagno- 
styczny, zwłaszcza w sytuacji, gdy uczniowie, przez wiele lat szkolnych diagno- 
zowani skalą WISC-R, np. jako niepełnosprawni intelektualnie w stopniu umiar- 
kowanym, badani ponownie WAIS-R (PL), po ukończeniu szkoły czy uzyskaniu 
pełnoletności, uzyskują wyniki wskazujące na lekki stopień niepełnosprawności, 
pomimo iż poziom ich funkcjonowania szkolnego ani społecznego nie uległ 
zmianie. Taka psychometryczna diagnoza może mieć poważne konsekwencje 
administracyjne, np. może odebrać przysługujące prawo do renty socjalnej. War- 
to zwrócić uwagę, że problem ten pojawił się wraz z wersją zrenormalizowaną 
WAIS-R (PL) z 2004 roku. Praktyka pokazuje jednak, że w kłopotliwej sytuacji 
dużej rozpiętości wyników pomiędzy WISC-R a WAIS-R (PL) wystarczy wrócić 
do wersji WAIS-R (PL) z 1996 roku, by uzyskać porównywalny do mierzonego 
WISC-R poziom sprawności poznawczej danej osoby. 

Problemy diagnostyczne praktyków, zróżnicowane opinie amerykańskich 
badaczy, jak również brak polskich badań dotyczących stabilności osiągnięć 
testowych w dzieciństwie i adolescencji przyczyniły się do podjęcia tego pro- 
blemu w badaniach. Niezgodność pomiędzy skalami u osób niepełnosprawnych 
intelektualnie była potwierdzana przez amerykańskich badaczy. Sygnalizowana 
jest także przez psychologów praktyków. Natomiast w przedziale wyników 
mieszczących się w normie doniesienia są niejednoznaczne. Dlatego poszukiwa- 
no odpowiedzi na pytania, czy w przedziale wyników przeciętnych WISC-R 
i WAIS-R (PL) będą zgodne, czy może — podobnie jak przy wartościach niskich 
— będą się znacząco różnić? 

Ze względu na sugestie psychologów praktyków dotyczące różnic pomiędzy 
WAIS-R (PL) z 1996 i z 2004 roku, pytania i hipotezy sformułowano oddzielnie 
do obu wersji testu. Biorąc pod uwagę cytowane ustalenia Wechslera (1981) 
i innych (por. Anastasi i Urbina, 1999), uwzględniając, że doniesienia praktyków 
dotyczą wyników niskich, założono, że w grupie osób w normie intelektualnej 
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nie ma znaczących różnic pomiędzy wynikami w WISC-R oraz WAIS-R (PL) 
z 2004 roku. Podobnie założono, że w tej grupie badanych nie ma istotnych róż- 
nic również między WISC-R i WAIS-R (PL) z 1996 roku. Powyższe hipotezy 
sprawdzono w badaniach podłużnych. Wyniki WISC-R porównano z WAIS-R 
(PL) w wersji zrenormalizowanej (2004) oraz w wersji sprzed renormalizacji 
(1996). Szczególną uwagę zwrócono na następstwa dla praktyki psychologicznej. 


METODA 


Dwukrotnie badano te same osoby (N = 31, 20 kobiet i 11 mężczyzn) za po- 
mocą WISC-R — w wieku około 8 lat oraz WAIS-R (PL) — w wieku około 21 lat. 
Tabela 1 ilustruje strukturę grupy w powtórnym badaniu. 


Tabela 1 
Struktura grupy badanych 
Studia Kobiety Mężczyźni Razem 
Nie studiuje 3 1 4 
Uczelnia Niestacjonarne 1 1 2 z 
niepubliczna Stacjonarne 1 3 4 
Niestacjonarne 4 2 6 
Uczelnia publiczna 21 
Stacjonarne 11 4 15 
Razem 20 11 31 


Wyniki testu dla dorosłych liczono na dwa sposoby: (1) zgodnie z instrukcją 
i normami WAIS-R (PL) z 2004 roku oraz (2) zgodnie z instrukcją i normami 
WAIS-R (PL) z 1996 roku. Było to możliwe ze względu na niewielkie zmiany 
w procedurze badania w obu wersjach, natomiast zasadnicze w sposobie przeli- 
czania wyników. Porównano ilorazy inteligencji w Skali Pełnej, Słownej i Bez- 
słownej, wyniki przeliczone w poszczególnych testach oraz wyniki czynnikowe. 
Wartości dla czynników ustalono zgodnie z modelem trójczynnikowym (Za- 
krzewska, 2000). Porównanie wartości średnich pozwoliło sprawdzić, w jakim 
stopniu dana cecha pozostaje niezmienna w czasie. Współczynniki korelacji wy- 
kazały, w jakim stopniu badani zachowują swą pozycję na tle grupy pod wzglę- 
dem poziomu badanej cechy. W analizie danych posłużono się programem staty- 
stycznym SPSS. Istotność różnic pomiędzy wynikami WISC-R i WAIS-R (PL) 
sprawdzano testem t Studenta (4) dla prób zależnych, a w celu zilustrowania 
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współzmienności wyników obu skal posłużono się współczynnikiem korelacji 
Pearsona (7). 


WYNIKI 


WISC-R i WAIS-R (PL) wersja zrenormalizowana z 2004 roku 


Porównanie wartości średnich ilorazów inteligencji wskazało na istotne róż- 
nice na korzyść WAIS-R (PL) w Skali Pełnej i Słownej. W Skali Wykonawczej 
różnica jest statystycznie nieistotna. Współczynniki korelacji okazały się znaczą- 
ce. Dodatni związek pomiędzy wynikami obu testów oznacza, że pod względem 
badanej cechy badani zachowują swą pozycję na tle grupy. Wyniki w poszcze- 
gólnych testach przedstawiono na Wykresie 1. 


—e—WISC-R —®*—WAIS-R(PL) 


Wyniki przeliczone 


Uwaga. * p < 0,05; ** p < 0,01; *** p < 0,001. 


Wykres 1. Profile testów WISC-R i WAIS-R (PL) z 2004 roku. 


W większości testów średnie wartości są znacząco wyższe w skali WAIS-R 
(PL). Wyniki obu skal są zbliżone w trzech testach (Słownik, Porządkowanie 
Obrazków, Układanki). Przebieg krzywych ilustrujących pomiary w dwóch 
punktach czasowych jest podobny, zmiany następują jednokierunkowo. Współ- 
zmienność ta jest istotna w zakresie następujących podtestów: Wiadomości 
(r = 0,46; p < 0,01), Podobieństwa (r = 0,59; p < 0,01), Wzory z Klocków 
(r = 0,58; p < 0,01), Kodowanie (r = 0,56; p < 0,01), Porządkowanie Obrazków 
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(r = 0,38; p < 0,05) i Układanki (r = 0,44; p < 0,05). Pary wyników czynniko- 
wych Rozumienie Werbalne (t = -2,95, p < 0,01; r = 0,79, p < 0,001) oraz Pa- 
mięć i Odporność na Dystraktory (t = -4,09, p < 0,001; r = 0,47, p < 0,01) różnią 
się istotnie na korzyść WAIS (PL). Natomiast różnica pomiędzy średnimi warto- 
ściami czynników Organizacji Percepcyjnej (t = -0,52 ni; r = 0,60, p < 0,001) nie 
jest znacząca. Korelacje są istotne, związek pomiędzy każdą parą wyników 
czynnikowych jest dodatni. 


WISC-R i WAIS-R (PL) z 1996 roku 


Procedura przeliczania wyników surowych na przeliczone WAIS-R (PL) 
z 1996 roku spowodowała znaczące obniżenie wyników — w porównaniu z wer- 
sją zrenormalizowaną — zarówno w Skali Pełnej (t = 13,25; p < 0,001), Słownej 
(t = 14,42; p < 0,001), jak i Wykonawczej (t = 6,78; p < 0,001). W efekcie różni- 
ce między ilorazami w Skali Pełnej i Słownej znacząco się zmniejszyły i okazały 
się nieistotne statystycznie. Obniżenie wyników w Skali Wykonawczej spowodo- 
wało natomiast, że wcześniej nieistotne różnice powiększyły się, tym razem na 
korzyść WISC-R. W trzech testach Skali Wykonawczej (Uzupełnianie Obraz- 
ków, Wzory z Klocków i Kodowanie) różnice pozostały na korzyść WAIS-R 
(PL). Współczynniki korelacji, podobnie jak poprzednio, są istotne statystycznie 
i wskazują na dodatni związek między testami. Poszczególne testy Skali Słownej 
i Bezsłownej ilustruje Wykres 2. 


15 


—e— WISC-R —®#— WAIS-R (PL) 


Wyniki przeliczone 


zo D D 0 $ RY os RY NS x 
$ Ss Ss RS & ob xe ae U O S 
O ze < g O KO é A ws 8 x 
G O S N Eà ea O o a S AŚ 
U Pom ae KS Ra L O g A N 
© Q $ € gÀ S o” ww 
3 Cà ss 
Y a ry 
RO Ka 


Wykres 2. Profile testów WISC-R i WAIS-R (PL) z 1996 roku. 
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Różnice pomiędzy testami Skali Słownej WISC-R i WAIS-R (PL) z 1996 ro- 
ku są nieistotne statystycznie, natomiast między testami Skali Wykonawczej — 
zróżnicowane. Na korzyść testu dla dzieci, wartości średnich różnią się znacząco 
w Porządkowaniu Obrazków, na korzyść testu dla dorosłych — w trzech testach: 
Uzupełnianie Obrazków, Wzory z Klocków oraz Kodowanie. Współczynniki 
korelacji są znaczące w: Podobieństwach (r = 0,63; p < 0,001), Wiadomościach 
(r = 0,52; p < 0,01), Powtarzaniu Cyfr (r = 0,55; p < 0,001), Wzorach z Klocków 
(r = 0,59; p < 0,01), Kodowaniu (r = 0,56; p < 0,01), Układankach (r = 0,51; 
p < 0,01) i Porządkowaniu Obrazków (r = 0,43; p < 0,05). Różnica między pa- 
rami wyników czynnikowych w Rozumowaniu Słownym (£ = 3,46, p < 0,01; 
r = 0,70, p < 0,001) jest na korzyść WISC-R, a więc odwrotnie niż w WAIS-R 
(PL) z 2004 roku, oraz inaczej niż przy porównaniu ilorazów Skal Słownych. 
Różnica między czynnikami Organizacji Percepcyjnej (t = 0,47 ni; r = 0,42, 
p < 0,05) jest nieistotna, analogicznie jak w porównaniu z nowszą wersją 
WAIS-R (PL), ale również inaczej niż w porównaniu ilorazów Skal Wykonaw- 
czych. Trzeci czynnik — Pamięć i Odporność na Dystraktory (t = -3,67, p < 0,01; 
r = 0,52, p < 0,01) — w obu sposobach przeliczania wyników wypada na korzyść 
adolescentów, co pozwala uznać rzeczywisty postęp w tym zakresie pomiędzy 
porównywanymi badaniami. 


DYSKUSJA 


Porównanie wyników uzyskanych przez osoby w normie intelektualnej, 
badane za pomocą testu WISC-R oraz aktualnie stosowanej w Polsce wersji 
WAIS-R (PL), sugeruje, że grupa w okresie między pomiarami znacznie rozwi- 
nęła zdolności słowne, podczas gdy bezsłowne pozostały na tym samym pozio- 
mie. Rezultat ten jest zgodny z doniesieniami amerykańskich badaczy. Przeczy 
jednocześnie domniemaniu równoważności obu skal w zakresie wyników prze- 
ciętnych. Z, kolei porównanie skali dla dzieci oraz dorosłych w wersji z 1996 
roku przyniosło odmienne rezultaty. Sugerują one, że w okresie między pomia- 
rami zdolności wykonawcze grupy osłabły, natomiast zdolności słowne pozosta- 
ły na porównywalnym poziomie. 

Różnic pomiędzy wynikami dzieci i młodzieży, uwarunkowanych stosowaną 
wersją WAIS-R (PL), nie można wyjaśnić efektem Flynna. Zdaniem Flynna 
(2006) starsze normy zawyżają wyniki, podczas gdy w badaniach wykazano 
odwrotnie, że wyniki porównywane ze starszymi normami WAIS-R (PL) z 1996 
roku były znacząco niższe od porównanych do nowszych norm WAIS-R (PL) 
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z 2004 roku. Okazało się więc, ze podobnie jak w przedziale niskich ilorazów 
inteligencji, również w przedziale przeciętnych ilorazów inteligencji wyniki 
WAIS-R (PL) z 2004 roku są znacząco wyższe w porównaniu z WISC-R. Tego 
rodzaju obserwacje nie były zgłaszane przez praktyków. W przedziale wyników 
przeciętnych taka zmiana może uchodzić uwadze diagnostów. U osób w normie 
intelektualnej zdecydowanie rzadziej monitoruje się postępy w rozwoju umysło- 
wym badaniami testowymi. Ponadto w interpretacji łatwiej przyjąć, że zmiany są 
naturalną konsekwencją rozwoju danej osoby. 

Pojawia się jednak wątpliwość, czy przyrost wyników wykazywany przez 
WAIS-R (PL) można traktować jako efekt zmian w poziomie funkcjonowania 
poznawczego pomiędzy dzieciństwem i adolescencją. Uzasadnieniem dla odpo- 
wiedzi twierdzącej może być — z jednej strony — dynamika rozwoju w okresie 
objętym badaniem, a z drugiej — Ścisłe powiązanie wyników testowych z umie- 
jętnościami kształconymi w szkołach. Zwykle badania wykazują wzrastanie wy- 
ników u osób, które dłużej kontynuują edukację (Anastasi i Urbina, 1999). 
W badaniach uczestniczyli studenci, którzy między pomiarami ćwiczyli te aka- 
demickie zdolności. W podręczniku do testu (Brzeziński i in., 2007) czytamy, że 
zmienną, która najsilniej różnicuje wyniki w WAIS-R (PL), jest poziom wy- 
kształcenia. Jednak przy założeniu niezmienności IQ w ciągu życia zmiany 
stwierdzone w powtórnym badaniu testowym można też przypisać słabości na- 
rzędzi pomiarowych. 

Pojęcie niezmienności IQ odnosi się do populacji, a nie do jednostek. Nasu- 
wa się jednak pytanie, czy praktyka posługiwania się starszą wersją WAIS-R 
(PL) z 1996 roku, w sytuacji problemowej rozbieżności WAIS-R (PL) z 2004 
roku i WISC-R, może być praktyką uzasadnioną? Zdaniem Anastasi i Urbiny 
(1999) dopóki narzędzie służy do formułowania hipotez, jego stosowanie może 
być uzasadnione. W diagnozie indywidualnej psycholog dysponuje różnymi da- 
nymi, np. z obserwacji czy wywiadu, które łączy z wynikami testowymi w celu 
uzyskania całościowego obrazu badanej osoby. To chroni go przed nadmiernym 
generalizowaniem wyników testowych i częściowo wyjaśnia trwanie przy te- 
stach, niezależnie od właściwości ich parametrów psychometrycznych. Kontakt 
w czasie badania dostarcza doświadczonemu diagnoście znacznie więcej infor- 
macji o mocnych i słabych stronach badanego niż pojedynczy wskaźnik, jakim 
jest IQ. 

Opieranie się tylko na psychometrycznym kryterium może prowadzić do 
uproszczeń, a nawet błędnych konkluzji, na co zwraca uwagę wielu autorów. 
Przyznają, że testy są pomocne w postawieniu diagnozy, szczególnie na etapie 
wstępnym, ale rozstrzygające powinno być pełne badanie psychologiczne i kli- 
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niczne. Odpowiedzialność za trafne wykorzystanie testu spoczywa na osobie, 
która go interpretuje, a taka interpretacja pociąga za sobą odpowiedzialność za 
konsekwencje (Messick, 2005; Standardy dla testów, 2007). Anastazi i Urbina 
(1999) uważają, że decydowanie tylko na podstawie testów jest ich nadużyciem. 
Testy stanowią bowiem jedno ze źródeł danych, nie są rozstrzygającymi narzę- 
dziami, decyzje powinni podejmować ludzie. 

Udostępnienie polskim psychologom skal do badania inteligencji Wechslera 
ma nieocenione znaczenie dla diagnostyki psychologicznej. Zostały osadzone 
w polskich realiach kulturowych, ale zachowały „ducha” oryginału (Brzezinski 
i in., 1996, 2007), a wraz z nim problemy sygnalizowane zarówno przez amery- 
kańskich badaczy, jak i polskich psychologów. Nowsze i doskonalsze wersje 
testów zapewne będą od nich wolne. 
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